智能论文笔记

Benchopt: Reproducible, efficient and collaborative optimization benchmarks

Thomas Moreau , Mathurin Massias , Alexandre Gramfort , Pierre Ablin , Pierre-Antoine Bannier , Benjamin Charlier , Mathieu Dagréou , Tom Dupré la Tour , Ghislain Durif , Cassio F. Dantas

分类：机器学习 | (统计)机器学习

2022-06-27

数值验证是机器学习研究的核心，因为它允许评估新方法的实际影响，并确认理论和实践之间的一致性。然而，该领域的快速发展构成了一些挑战：研究人员面临着大量的方法来比较，有限的透明度和最佳实践的共识以及乏味的重新实施工作。结果，验证通常是非常部分的，这可能会导致错误的结论，从而减慢研究的进展。我们提出了Benchopt，这是一个协作框架，旨在在跨编程语言和硬件体系结构的机器学习中自动化，复制和发布优化基准。 Benchopt通过提供用于运行，共享和扩展实验的现成工具来简化社区的基准测试。为了展示其广泛的可用性，我们在三个标准学习任务上展示基准：$ \ ell_2 $ regulaine的逻辑回归，套索和RESNET18用于图像分类的培训。这些基准强调了关键的实际发现，这些发现对这些问题的最新问题更加细微，这表明在实际评估中，魔鬼在细节上。我们希望Benchopt能在社区中促进合作工作，从而改善研究结果的可重复性。

translated by 谷歌翻译

在本文中，我们组合了两个独立的检测方法来识别假新闻：算法Vago使用语义规则与NLP技术相结合，测量文本中的模糊和主体性，而分类器假CLF依赖于卷积神经网络分类和监督深度学习将文本分类为偏见或合法。我们比较四个语料库的两种方法的结果。我们在vago获得的模糊和主观性措施之间找到了积极的相关性，以及由假CLF偏向的文本分类。比较产生互利：Vago有助于解释假CLF的结果。相反，Fake-CLF帮助我们证实并扩展Vago的数据库。使用两个互补技术（以基于规则的VS数据驱动）证明了识别假新闻的挑战性问题。

translated by 谷歌翻译